多段自然言語処理における NLP, シソーラス, オントロジー辞書データ統合の提案
多段自然言語処理
分析を行うために同時に複数の自然言語リソースによる多段処理を行う(1. はじめに)
リソースの登録語彙を調査した論文
本研究では多段自然言語処理において辞書データの不整合が招く処理失敗率低減を目的として, 辞書データの統合を提案した. (7. おわりに)
対象のソフトウェア(5.1)
形態素解析器
lucene-gosen
Sudachi
調査方法(5.3)
形態素解析結果を順次検索し, 名詞または動詞と解析されたものを検索処理へ送る.
検索対象になった語の数, WordNet に存在した語の数, DBPedia に存在した語の数をカウントする.